20 research outputs found
Multiobjective Reinforcement Learning for Reconfigurable Adaptive Optimal Control of Manufacturing Processes
In industrial applications of adaptive optimal control often multiple
contrary objectives have to be considered. The weights (relative importance) of
the objectives are often not known during the design of the control and can
change with changing production conditions and requirements. In this work a
novel model-free multiobjective reinforcement learning approach for adaptive
optimal control of manufacturing processes is proposed. The approach enables
sample-efficient learning in sequences of control configurations, given by
particular objective weights.Comment: Conference, Preprint, 978-1-5386-5925-0/18/$31.00 \c{opyright} 2018
IEE
Modellfreies Lernen optimaler zeitdiskreter Regelungsstrategien für Fertigungsprozesse mit endlichem Zeithorizont
Die Qualität und Leistungsfähigkeit von Bauteilen wird wesentlich von der Ausführung der beteiligten Fertigungsprozesse bestimmt. Das Prozessergebnis hängt -- neben dem Anfangszustand des Bauteils und des Prozesses -- von dem Prozessverlauf ab. Bei vielen Fertigungsprozessen kann der Prozessverlauf durch zeitlich veränderliche Stellgrößen maßgeblich bestimmt werden.
Die Optimierung dieser zeitveränderlichen Größen mit Hinsicht auf die Qualität des Bauteils ist Gegenstand dieser Arbeit. Die Bauteilqualität ergibt sich zum einen aus den makroskopischen Eigenschaften des erzeugten Bauteils und zum anderen aus der Material-Struktur am Ende des Fertigungsprozesses. Beides lässt sich häufig erst im Anschluss an die Prozessausführung, in Form einer Qualitätskontrolle, beurteilen und quantifizieren. Prozesspfade sind Sequenzen von Werten der Stellgrößen, die in dieser Arbeit mit Hinsicht auf die Ergebnisqualität optimiert werden.
Reale Prozesse sind nicht vollständig determiniert, sondern hängen auch von während des Prozesses schwankenden Prozessbedingungen ab, die häufig nicht direkt messbar sind. Somit können keine allgemein gültigen, optimalen Prozesspfade ermittelt werden.
Die Optimierung der Stellgrößen muss vielmehr während der Prozessausführung erfolgen und stellt dann ein Problem der optimalen Regelung dar, wo anstelle der Prozesspfade Regelungsstrategien treten. Diese sind Abbildungen von beobachteten Größen auf Stellgrößen, welche in Hinsicht auf das Prozessergebnis optimiert werden. Herkömmliche Methoden zur optimalen Regelung setzen meist ein Prozessmodell voraus, das gleichzeitig effizient zu berechnen und ausreichend akkurat bezüglich der Aufgabenstellung sein muss. Dies stellt insbesondere bei komplexen nicht-linearen Fertigungsprozessen eine hohe Hürde dar.
Ziel der vorliegenden Arbeit ist deshalb die Entwicklung und Untersuchung von modellfreien Methoden, die selbstständig optimale Regelungsstrategien von Fertigungsprozessen in Hinsicht auf die Ergebnisqualität lernen. Die Basis für derartige Methoden findet sich in Bereichen des bestärkenden maschinellen Lernens und der adaptiven dynamischen Programmierung.
Zur Erreichung dieses übergreifenden Ziels werden in der Arbeit zwei Problemklassen, (a) die Optimierung von Regelungsstrategien partiell beobachtbarer Fertigungsprozesse (bei denen stellvertretend für den Prozesszustand nur einige, davon abhängige Messgrößen vorliegen) unter variierenden Einflüssen und (b) die Struktur-geleitete Optimierung von Fertigungsprozessen (bei denen die Herstellung einer gegebenen Material-Struktur angestrebt wird) definiert und Methoden des bestärkenden Lernens zur Lösung dieser Problemklassen gegenüber dem Stand der Forschung fortentwickelt und untersucht. Dabei werden weitere besondere Aufgabenstellungen in dem Kontext des übergreifenden Ziels, insbesondere die Entscheidungsoptimierung unter sich ändernden Zielvorgaben und die dateneffiziente Entscheidungsoptimierung bei mehreren äquivalenten Zielen, adressiert.
Die entwickelten, generischen Methoden werden für Prozesse der Metallverarbeitung ausgeprägt und in einer virtuellen Surrogat-Umgebung experimentell untersucht. Die physikalische Simulation eines Tiefziehprozesses wird durch Module zur Simulation der variierenden Prozesseinflüsse und der partiellen Beobachtbarkeit erweitert und bildet die Basis der Untersuchungen der Lösungsmethoden für die Problemklasse (a). Die Simulation eines Metall-Bearbeitungsprozesses zur einachsigen Deformation in beliebige Richtungen bildet die Basis der Untersuchungen zur Struktur-geleiteten Optimierung. Die Ergebnisse der Untersuchungen zeigen die Leistungsfähigkeit der entwickelten Methoden im Vergleich zu klassischen Basismethoden. Neben der Leistungsfähigkeit werden die Dateneffizienz und die Robustheit gegenüber Parameterausprägungen der entwickelten Methoden gezeigt und die Auswirkungen einzelner entwickelter Methodenbestandteile auf die Ergebnisse untersucht
Modellfreies Lernen optimaler zeitdiskreter Regelungsstrategien für Fertigungsprozesse mit endlichem Zeithorizont
Die Qualität und Leistungsfähigkeit von Bauteilen wird wesentlich von der Ausführung der beteiligten Fertigungsprozesse bestimmt. Das Prozessergebnis hängt -- neben dem Anfangszustand des Bauteils und des Prozesses -- von dem Prozessverlauf ab. Bei vielen Fertigungsprozessen kann der Prozessverlauf durch zeitlich veränderliche Stellgrößen maßgeblich bestimmt werden.
Diese Arbeit behandelt Methoden zur Optimierung dieser zeitveränderlichen Größen unter schwankenden Prozessbedingungen
Neural Networks for Constitutive Modeling -- From Universal Function Approximators to Advanced Models and the Integration of Physics
Analyzing and modeling the constitutive behavior of materials is a core area
in materials sciences and a prerequisite for conducting numerical simulations
in which the material behavior plays a central role. Constitutive models have
been developed since the beginning of the 19th century and are still under
constant development. Besides physics-motivated and phenomenological models,
during the last decades, the field of constitutive modeling was enriched by the
development of machine learning-based constitutive models, especially by using
neural networks. The latter is the focus of the present review, which aims to
give an overview of neural networks-based constitutive models from a methodical
perspective. The review summarizes and compares numerous conceptually different
neural networks-based approaches for constitutive modeling including neural
networks used as universal function approximators, advanced neural network
models and neural network approaches with integrated physical knowledge. The
upcoming of these methods is in-turn closely related to advances in the area of
computer sciences, what further adds a chronological aspect to this review. We
conclude this review paper with important challenges in the field of learning
constitutive relations that need to be tackled in the near future
A multi-task learning-based optimization approach for finding diverse sets of material microstructures with desired properties and its application to texture optimization
The optimization along the chain processing-structure-properties-performance is one of the core objectives in data-driven materials science. In this sense, processes are supposed to manufacture workpieces with targeted material microstructures. These microstructures are defined by the material properties of interest and identifying them is a question of materials design. In the present paper, we addresse this issue and introduce a generic multi-task learning-based optimization approach. The approach enables the identification of sets of highly diverse microstructures for given desired properties and corresponding tolerances. Basically, the approach consists of an optimization algorithm that interacts with a machine learning model that combines multi-task learning with siamese neural networks. The resulting model (1) relates microstructures and properties, (2) estimates the likelihood of a microstructure of being producible, and (3) performs a distance preserving microstructure feature extraction in order to generate a lower dimensional latent feature space to enable efficient optimization. The proposed approach is applied on a crystallographic texture optimization problem for rolled steel sheets given desired properties
Deep Reinforcement Learning Methods for Structure-Guided Processing Path Optimization
A major goal of materials design is to find material structures with desired
properties and in a second step to find a processing path to reach one of these
structures. In this paper, we propose and investigate a deep reinforcement
learning approach for the optimization of processing paths. The goal is to find
optimal processing paths in the material structure space that lead to
target-structures, which have been identified beforehand to result in desired
material properties. There exists a target set containing one or multiple
different structures. Our proposed methods can find an optimal path from a
start structure to a single target structure, or optimize the processing paths
to one of the equivalent target-structures in the set. In the latter case, the
algorithm learns during processing to simultaneously identify the best
reachable target structure and the optimal path to it. The proposed methods
belong to the family of model-free deep reinforcement learning algorithms. They
are guided by structure representations as features of the process state and by
a reward signal, which is formulated based on a distance function in the
structure space. Model-free reinforcement learning algorithms learn through
trial and error while interacting with the process. Thereby, they are not
restricted to information from a priori sampled processing data and are able to
adapt to the specific process. The optimization itself is model-free and does
not require any prior knowledge about the process itself. We instantiate and
evaluate the proposed methods by optimizing paths of a generic metal forming
process. We show the ability of both methods to find processing paths leading
close to target structures and the ability of the extended method to identify
target-structures that can be reached effectively and efficiently and to focus
on these targets for sample efficient processing path optimization
Genealogisches Bewusstsein als Legitimation. Inter-und intragenerationelle Auseinandersetzungen sowie die Bedeutung von Verwandtschaft bei Amtswechseln
Dieser Band ist eine Zusammenstellung von Beiträgen, die auf eine vom Bamberger DFG-Graduiertenkolleg ´Generationenbewusstsein und Generationenkonflikte´ in Antike und Mittelalter veranstaltete interdisziplinären Nachwuchstagung zurückgehen. Darin werden weltliche und geistliche Amts- und Herrschaftswechsel der Vormoderne mit Fragen nach genealogischem Bewusstsein, inter- und intragenerationellen Auseinandersetzungen und der Bedeutung von Verwandtschaften verknüpft und beleuchtet. Der Untersuchungsraum erstreckt sich hierbei von Frankreich nach Persien sowie von Deutschland nach Ägypten; zeitlich wird ein Bogen gespannt vom 5. vorchristlichen bis zum 18. nachchristlichen Jahrhundert